01. 项目概述
项目概述
在本项目中,你将分析一个数据集,然后传达你的发现。你将使用 Python 库 NumPy、Pandas 和 Matplotlib 来使你的分析工作更加轻松。
我需要安装什么?
你需要安装 Python 和以下库:
- pandas
- numpy
- matplotlib
- csv
我们建议安装 Anaconda ,它自带所有必要的包和 IPython 笔记本。你可以在 此处 找到安装说明。
为何要进行此项目?
此项目将向你介绍数据分析过程,以及所有工作的相互配合。后期的纳米学位将重点关注数据分析过程的各个环节。
你将使用 Python 库 NumPy、Pandas 和 Matplotlib,这些库使你能够更加轻松地在 Python 中编写数据分析代码!不仅如此,它们也是雇主们青睐的技能!
我将学到什么?
完成此项目后,你将:
*了解典型数据分析过程中所涉及到的所有步骤
*轻松提出可用给定数据集回答的问题,并解答这些问题。
- 了解如何调查数据集中的问题,以及将数据整理成你可以使用的格式
- 练习传达你的分析结果
- 能够在 NumPy 和 Pandas 中使用向量化运算,以加快数据分析代码的运行速度
- 熟悉 Pandas 的 Series 和 DataFrame 对象,它们能使你访问数据更方便
- 了解如何使用 Matplotlib 生成图形,展示你的发现